NeurIPS2022|Rebuttal起死回生！对攻击者的攻击：一种真实场景下的防御

作者：lan1998_789 | 来源：互联网 | 2023-07-28 16:51

点击下方卡片，关注“CVer”公众号AICV重磅干货，第一时间送达点击进入—CV微信技术交流群上海交通大学自动化系图像处理与模式识别研究所黄晓霖副教授

点击下方卡片&＃xff0c;关注“CVer”公众号

AI/CV重磅干货&＃xff0c;第一时间送达

点击进入—> CV 微信技术交流群

上海交通大学自动化系图像处理与模式识别研究所黄晓霖副教授团队&＃xff0c;与鲁汶大学、加州大学圣克鲁兹分校的研究者合作&＃xff0c;关注真实场景的防御&＃xff0c;提出主动对攻击者实施攻击&＃xff0c;在保证用户正常使用模型&＃xff08;无精度/速度损失&＃xff09;的同时&＃xff0c;有效阻止黑盒攻击者通过查询模型输出生成对抗样本。经Rebuttal极限提分&＃xff08;2 4 4 5 -> 7 7 4 7&＃xff09;&＃xff0c;该研究已被机器学习顶级会议 NeurIPS 2022 录用&＃xff0c;代码已开源。

Adversarial Attack on Attackers: Post-Process to Mitigate Black-Box Score-Based Query Attacks

论文&＃xff1a;https://arxiv.org/abs/2205.12134

代码&＃xff1a;https://github.com/Sizhe-Chen/AAA

【研究背景】

基于查询分数的攻击&＃xff08;score-based query attacks, SQAs&＃xff09;极大增加了真实场景中的对抗风险&＃xff0c;因为其仅需数十次查询模型输出概率&＃xff0c;即可生成有效的对抗样本。

然而&＃xff0c;现有针对worst-case扰动的防御&＃xff0c;并不适用于真实场景中&＃xff0c;因为他们通过预处理输入或更改模型&＃xff0c;显著降低了模型的推理精度/速度&＃xff0c;影响正常用户使用模型。

因此&＃xff0c;本文考虑通过后处理来防御&＃xff0c;其自带以下优点

· 有效防御基于查询分数的攻击

· 不影响模型精度&＃xff0c;甚至还能使模型的置信度更加准确

· 是一种轻量化&＃xff0c;即插即用的方法

可是在真实的黑盒场景中&＃xff0c;攻击者和用户得到的&＃xff0c;是相同的模型输出信息&＃xff0c;如何在服务用户的同时&＃xff0c;防御潜在攻击者&＃xff1f;

【本文方法】

我们的核心思路是&＃xff0c;测试阶段主动误导攻击者进入错误的攻击方向&＃xff0c;也就是对攻击者发动攻击&＃xff08;adversarial attack on attackers, AAA&＃xff09;。如下图所示&＃xff0c;若我们将模型的&＃xff08;未经防御的&＃xff09;蓝色损失函数曲线&＃xff0c;轻微扰动至橙色或绿色的曲线&＃xff0c;那么当攻击者贪婪地沿梯度下降方向搜索对抗样本时&＃xff0c;将会被愚弄至错误的攻击方向。

具体的&＃xff0c;我们的算法分为4步&＃xff0c;对应上图中的4行

1. 计算未经修改的原损失函数值&＃xff0c;也就是上图中的蓝色曲线

2. 根据原损失函数值&＃xff0c;计算出目标损失函数值&＃xff0c;即橙色或绿色曲线

3. 根据预先标定的温度T&＃xff0c;计算出目标置信度

4. 优化输出的logits&＃xff0c;使其同时拥有目标损失函数值和目标置信度

【 实验结果 】

如下左图所示&＃xff0c;对比蓝线和橙线&＃xff0c;我们的方法AAA&＃xff0c;最小程度地扰动输出&＃xff0c;却最大限度保留精度&＃xff08;Acc ↑&＃xff09;&＃xff0c;提升置信度的准确度&＃xff08;expected calibration error, ECE ↓&＃xff09;。如右图和下表所示&＃xff0c;AAA相比现有方法&＃xff0c;能有效地防止真实场景攻击下的精度损失。

同时&＃xff0c;AAA能简单地与现有防御结合&＃xff0c;如对抗训练。

AAA是极其轻量化的防御&＃xff0c;因为后处理操作的计算量很小&＃xff0c;如下图所示。

尽管攻击者可以对AAA设计自适应攻击&＃xff08;adaptive attacks&＃xff09;&＃xff0c;但在真实场景中&＃xff0c;自适应攻击的成本非常高。因为黑盒场景下&＃xff0c;攻击者完全没有模型的信息&＃xff0c;更不用说其防御策略了。探索模型防御策略以设计自适应攻击&＃xff0c;需要大量额外的查询。更重要的是&＃xff0c;自适应攻击者也很好愚弄&＃xff0c;比如使用正弦类的目标损失函数曲线以迷惑攻击者&＃xff0c;因为其策略更难被猜测。如下表所示&＃xff0c;反向搜索和双向搜索的自适应攻击&＃xff0c;都可以被AAA-sine很好的防御。

【 文章总结 】

我们指出在真实场景下&＃xff0c;一个简单的后处理模块&＃xff0c;就可以形成有效&＃xff0c;用户友好&＃xff0c;即插即用的防御。为了专门防御基于查询分数的攻击&＃xff0c;我们设计了对攻击者的攻击&＃xff0c;通过细微的输出扰动干扰攻击者。广泛的实验表明我们的方法在抵御攻击&＃xff0c;精度&＃xff0c;置信度准确度&＃xff0c;速度上&＃xff0c;显著优于现有防御。

值得注意的是&＃xff0c;抵御其他类型的攻击并非本文关注的重点。我们的方法并不提升worst-case robustness&＃xff0c;故不能防御白盒攻击。我们也几乎不改变模型决策边界&＃xff0c;故不能防御迁移攻击和基于决策的查询攻击&＃xff08;decision-based query attacks&＃xff09;。

【 视频解读 】

论文一作陈思哲&＃xff08;左一&＃xff09;是上海交通大学自动化系的三年级硕士生&＃xff0c;研究方向为神经网络的对抗鲁棒性&＃xff0c;导师为黄晓霖副教授。他曾在TPAMI, NeurIPS, CVPR等期刊/会议发表论文7篇&＃xff0c;担任TPAMI, ECCV, PR等期刊/会议审稿人。他曾获上海交通大学优异学士学位论文&＃xff08;1%&＃xff09;&＃xff0c;两次获评国家奖学金&＃xff0c;并曾在腾讯朱雀实验室实习。个人主页&＃xff1a;https://sizhechen.top

论文通讯作者黄晓霖博士&＃xff08;右一&＃xff09;是上海交通大学的长聘教轨副教授&＃xff0c;研究方向为机器学习&＃xff0c;优化理论及其应用。他曾在Nature Reviews Methods Primers, JMLR, TPAMI, NeurIPS, CVPR等期刊/会议发表论文百余篇&＃xff0c;担任TPAMI, TAC, TSP, TNNLS, NeurIPS, ICML, ICLR, CVPR等期刊/会议审稿人。他曾获青年千人&＃xff0c;德国“洪堡学者”。他在清华大学获得博士学位&＃xff0c;并在鲁汶大学完成博士后研究。个人主页&＃xff1a;http://www.pami.sjtu.edu.cn/xiaolin

点击进入—> CV 微信技术交流群

CVPR 2022论文和代码下载

后台回复&＃xff1a;CVPR2022&＃xff0c;即可下载CVPR 2022论文和代码开源的论文合集

后台回复&＃xff1a;Transformer综述&＃xff0c;即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立扫描下方二维码&＃xff0c;或者添加微信&＃xff1a;CVer222&＃xff0c;即可添加CVer小助手微信&＃xff0c;便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖&＃xff1a;目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。一定要备注&＃xff1a;研究方向&＃43;地点&＃43;学校/公司&＃43;昵称&＃xff08;如目标检测或者Transformer&＃43;上海&＃43;上交&＃43;卡卡&＃xff09;&＃xff0c;根据格式备注&＃xff0c;可更快被通过且邀请进群▲扫码或加微信号: CVer222&＃xff0c;进交流群 CVer学术交流群&＃xff08;知识星球&＃xff09;来了&＃xff01;想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料&＃xff0c;欢迎扫描下方二维码&＃xff0c;加入CVer学术交流群&＃xff0c;已汇集数千人&＃xff01;▲扫码进群 ▲点击上方卡片&＃xff0c;关注CVer公众号

整理不易&＃xff0c;请点赞和在看

推荐阅读

int
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
int
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
list
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
list
MySQL初级篇——字符串、日期时间、流程控制函数的相关应用

文章目录：1.字符串函数2.日期时间函数2.1获取日期时间2.2日期与时间戳的转换2.3获取年月日、时分秒、星期数、天数等函数2.4时间和秒钟的转换2. ... [详细]

蜡笔小新 2024-11-14 10:57:02
int
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新 2024-11-13 19:31:37
list
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
function
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
format
如何使用 `org.apache.poi.openxml4j.opc.PackagePart` 类中的 `loadRelationships()` 方法及其代码示例详解

如何使用 `org.apache.poi.openxml4j.opc.PackagePart` 类中的 `loadRelationships()` 方法及其代码示例详解 ... [详细]

蜡笔小新 2024-11-10 07:30:36
tree
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
int
持续集成持续部署持续交付_您不进行持续集成！

持续集成持续部署持续交付今天，我将谈论开发人员的一个误解：持续集成是关于运行自动化集成管道的…什么是持续集成（CI） ... [详细]

蜡笔小新 2024-11-14 20:00:58
int
图像相似度对比的多种方法

本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ... [详细]

蜡笔小新 2024-11-13 11:04:56
int
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
function
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
int
[BZOJ2654] Tree 问题：二分查找与 Kruskal 算法结合的优化解决方案

题目《BZOJ2654: Tree》的时间限制为30秒，内存限制为512MB。该问题通过结合二分查找和Kruskal算法，提供了一种高效的优化解决方案。具体而言，利用二分查找缩小解的范围，再通过Kruskal算法构建最小生成树，从而在复杂度上实现了显著的优化。此方法不仅提高了算法的效率，还确保了在大规模数据集上的稳定性能。 ... [详细]

蜡笔小新 2024-11-11 18:19:28
int
利用栈实现四则运算表达式的高效求值方法

本文提出了一种基于栈结构的高效四则运算表达式求值方法。该方法能够处理包含加、减、乘、除运算符以及十进制整数和小括号的算术表达式。通过定义和实现栈的基本操作，如入栈、出栈和判空等，算法能够准确地解析并计算输入的表达式，最终输出其计算结果。此方法不仅提高了计算效率，还增强了对复杂表达式的处理能力。 ... [详细]

蜡笔小新 2024-11-11 14:00:53

lan1998_789

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章